查看原文
其他

【直播】我的基因组 36:这些可能是somatic突变的位点究竟是什么?

2017-01-01 生信菜鸟团 生信技能树

吓死我了!


前面我们讲到了可以把突变文件注释到dbsnp数据库,而dbsnp数据库信息非常丰富,比如我们可以看

##INFO=<ID=SAO,Number=1,Type=Integer,Description="Variant Allele Origin: 0 - unspecified, 1 - Germline, 2 - Somatic, 3 - Both">

这个SAO 信息很重要,请自行搜索了解变异为什么区分成germline和somatic。下面我用脚本统计一下SAO的信息:

cat realign.dbsnp.vcf |perl -alne '{/(SAO=\d)/;print $1}' |sort |uniq  -c

我有近76万的位点没有在dbsnp数据库里面,剩余的在dbsnp里面的,有1610个可以肯定是germline的mutation,还有142个是可能是somaticmutation,这些位点很可怕,somatic mutation意思是在人体成长过程中的后发突变,很大可能是癌症或者疾病相关突变!

我写脚本看了看这142个可能是somatic突变的位点所在的基因:


cat realign.dbsnp.vcf |perl -alne '{print if /SAO=3/;}' >dbsnp_both_germ_somatic.vcf

cat  dbsnp_both_germ_somatic.vcf  |grep GENEINFO |perl -alne '{/(GENEINFO=.*?);/;print $1}' |sort -u


MUC开头的我大概知道是什么意思,因为我有中耳炎,它突变我不觉得稀奇!

BRCA1,2都突变了,我觉得可能是科研界过度研究,这个我暂时也不害怕!

CD分子的突变,预示着免疫机理可能是有点麻烦,但毕竟只是可能!

其余的基因,我都不认识, 因为我知识水平有限!

当然,我只定位到了基因,没有看这个位点的突变对这个基因具体的影响!但是有研究表明它们可能是somatic的突变,其实就有一点风险了。(这就是为什么大家做基因检测看到的报告,都是有什么风险,很狗血,因为连负责这个检测报告的生信工程师也没办法给出肯定答案啊!)


有点不开心,不想看下去了。



文:Jimmy

图文编辑:吃瓜群众

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存